在我做AI的時候常常會覺得時間讓我很頭痛,不知道怎麼處理,甚至是訓練資料集跟測試資料集的時間壓根沒有重疊。
# #時間處理
x = str_pad(fraud_train$loctm, width = 6, pad = 0)
t3 = paste(('2019-01-01') %>% as.Date() + fraud_train$locdt,
paste0(substring(x,1, 2),':', substring(x,3, 4),':', substring(x,5, 6))) %>%
as.POSIXlt() %>% as.numeric()
對我就浪費了一點時間去檢視重疊率,既然是0那我就篩掉這個變數吧。
t3_data_f = data.frame(names = rep("t3",length(t3)),value = t3)
t6_data_f = data.frame(names = rep("t6",length(t6)),value = t6)
t9_data_f = rbind(t3_data_f,t6_data_f)
plot(t9_data_f)